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摘要 : [目的 /意义 ] 技术 研发 的 核心 是 人 才 。 研 发 轩 队 是 各 领域 技术 发 展 的 重点 关注 对 象 ， 也 是 机 构 
研发 实力 的 重要 体现 。[ 方法 /过程 ] 以 德 温 特 创新 索引 (DI) 专利 文献 为 分 析 对 象 ， 明 确 发 明 人 人 名 消 
歧 规则 ， 利 用 发 明 人 共 现 聚 类 确定 主要 研发 团队 ， 然 后 以 3D 打印 的 数字 光 处 理 相关 专利 来 进行 人 名 消 歧 
后 研发 团队 识别 的 实证 分 析 。[ 结果 /结论 ] 证 明 专 利 发 明 人 人 名 消 歧 有 利于 发 明 人 专利 数量 的 准确 分 析 。 
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技术 研发 的 核心 是 人 才 ， 信 息 环境 下 信息 
量 的 爆炸 式 增长 使 得 技术 人 研发 更 加 离 不 开 人 研究 
团队 的 通力 协作 ， 在 人 才 引 进 等 具体 政策 制定 
上 除了 关注 首席 专家 ， 更 应 关注 在 研发 团队 中 
起 到 核心 作用 的 关键 人 才 。 研 发 团队 识别 作为 
专利 分 析 的 重要 内 容 之 一 ， 有 利于 甄别 核心 团 
队 成 员 ， 发 现 非 首席 的 关键 人 才 ， 能 为 政策 制 
定 和 关键 研发 人 员 识别 提供 更 好 的 支持 。 但 是 
研发 人 员 姓 名 具有 很 强 的 歧义 性 ， 存 在 同名 多 
指 及 同人 不 同 写法 的 皮 义 问题 ， 因 此 研发 团队 
识别 研究 最 首要 的 问题 就 是 进行 人 名 消 上 政 ， 此 
时 人 名 消 歧 的 核心 目标 为 保障 准确 率 。 


@ 和 人 入 名 消 歧 研究 进展 
人 名 消 歧 主 要 是 对 姓名 表述 相同 或 相近 的 


两 个 姓名 是 否 指 向 同一 人 作出 判断 。A. Bagga 
等 中 于 1998 年 就 开始 把 跨 文本 人 名 消 歧 作 为 一 
种 人 名 共 指 问题 进行 探索 。2007 年 、2009 年 和 
2010 年 WePS 评测 研讨 会 进行 了 针对 网 络 人 名 
消 歧 的 评测 。 在 国内 ，CIPS-SIGHAN-2012 会 
议 中 对 中 文人 名 识别 与 消 歧 的 研究 也 越 来 越 多 。 

基于 网 页 等 资源 进行 人 名 相关 的 实体 特征 
抽取 、 聚 类 , 以 进行 人 名 消 歧 的 相关 研究 较 多 , 同 
时 社会 网 络 、 阔 值 或 概率 确定 原则 等 也 都 是 人 
名 消 歧 研究 中 探索 使 用 的 方法 。 如 G. Mann 等 站 
在 2003 年 通过 定制 模板 来 提取 网 页 个 人 传记 特 
征 来 构造 特征 向 量 的 方法 对 人 名 进行 “ 消 歧 ”。 
M. B. Fleischman 等 外 在 2004 年 抽取 名 字 特 
征 、 网 页 特征 、 重 又 特征 、 语 义 特征 等 ,使 用 
最 大 粹 模型 来 计算 两 个 名 字 指 向 同一 实体 的 概 
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率 。B. Malin”! F 2005 年 提出 基于 社会 网 络 来 
进行 人 名 消 歧 。K. Balog 等 四 于 2007 年 通过 训 
练 好 的 语言 模型 计算 网 页 中 人 名 指向 某 个 实体 
的 概率 ， 再 确定 阐 值 以 实现 人 名 消 歧 。Y. Chen 
等 中 在 2007 年 通过 抽取 基于 名 词 短语 的 特征 和 
命名 实体 的 特征 ， 再 使 用 层次 凝聚 聚 类 方法 进 
行 聚 类 。S. Ono 等 四 在 2008 年 基于 命名 实体 共 
指 、 关 键 词 以 及 主题 信息 的 混合 特征 来 对 文档 进 
行 聚 类 。L. Romano é ”! F 2009 年 提出 XMedia 
系统 采用 质量 闵 值 聚 类 算法 。 章 顺 瑞 等 '" 于 
2010 年 采用 层次 聚 类 算法 对 中 文人 名 进行 消 靶 。 
陈晨 等 中 在 2011 年 利用 不 同 社会 网 络 边 权 值 
和 不 同 图 划分 准则 对 人 名 消 歧 效 果 的 影响 进行 
了 中 文人 名 消 歧 的 研究 。 

随 着 人 名 消 歧 研究 的 不 断 深 入 ， 为 提高 准 
确 性 ， 针 对 特定 数据 源 的 人 名 消 歧 、 多 种 方法 
结合 的 分 步 式 研究 开始 增多 。2012 年 ， 杨 欣欣 
等 中 利用 网 络 资源 用 搜索 引 敬 四 类 查询 规则 扩 
展 特 征文 档 ， 利 用 二 层 聚 类 算法 "来 进行 人 名 
iit, 2013 年 李 广 一 等 55 根据 特征 类 型 来 设置 
权 值 ， 进 行 多 次 聚 类 。2014 4E S. Christian 等 l 
利用 数据 库 文 献 间 的 引用 构建 社会 网 络 图 来 实 
现 特 定数 据 源 的 人 名 消 歧 。2015 年 , 阳 怡 林 等 0 
通过 上 下 文 特征 、 实 体 特征 、 社 会 关系 特征 ， 利 
用 3 种 不 同 的 聚 类 算法 得 到 不 同 的 聚 类 划分 ， 再 
最 终 集 成 来 提高 人 名 消 层 的 准确 性 ,D. H. Han 5507 
采用 极限 学 习 机 提出 了 针对 每 一 个 姓名 及 姓名 
集合 的 两 种 聚 类 算法 来 进行 人 名 消 睹 。M. Song 
等 中 针对 PubMed 数据 库 构 建 了 专门 的 训练 
集 ， 并 提出 新 的 出 版 特征 集合 以 提高 准确 性 。 

整体 来 看 ， 当 前 研究 的 主要 对 象 以 网 络 资 
源 或 论文 著者 为 主 ， 具 体 方 法 上 以 通过 改进 算 
法 获取 更 多 人 名 相关 特征 ， 或 采用 多 次 /多 层 聚 
类 的 方法 来 进行 比 对 判断 为 主 。 这 些 方法 均 存 
在 一 定 程度 的 人 名 消 歧 误差 ， 且 这 部 分 误差 为 
算法 直接 判定 得 出 的 结果 ， 分 析 人 员 并 不 确定 
误差 可 能 涉及 的 人 名 范围 ,因此 存在 一 定 的 “ 黑 
箱 ”问题 。 

当前 针对 专利 文献 的 具体 特征 进行 发 明 人 
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人 名 消 疏 的 相关 人 研究 较 少 。 而 专利 发 明 人 的 车 
录 方 式 在 不 同 数 据 库 中 有 所 不 同 ， 基 本 都 同时 
涉及 中 国人 名 及 外 国人 名 的 消 歧 问题 。 另 外 , TE 
为 政策 支撑 的 专利 发 明 人 人 名 消 层 工作 需要 在 
确保 准确 的 核心 目标 下 提高 效率 。 因 此 基于 专 
利文 献 的 人 名 消 歧 需要 在 明确 专利 数据 库 发 明 
人 姓名 结构 特征 的 基础 上 进行 具体 探索 ， 以 提 
升 准确 性 ， 并 减少 “黑箱 子 ” 问题 带 来 的 误差 
不 确定 性 。 


O EHHA AWE 


德 温 特 创 新 索引 (DI) 是 经 过 人 工 智 力 
加 工 后 的 专利 数据 ， 具 有 可 以 批量 获取 、 自 然 
语言 检索 及 不 同 来 源 专 利 数据 统一 再 分 类 的 优 
势 ， 是 专利 分 析 的 常用 数据 之 一 。 本 文 将 针对 
该 数据 库 ， 结 合 汤 森 创新 (TI) 专利 数据 库 中 
发 明 人 机 构 、 国 家 等 特征 信息 来 进行 专利 发 明 
人 人 名 消 歧 规则 研究 。 
2.1 人 名 消 歧 流程 

本 文 主要 通过 发 明 人 姓名 结构 特征 来 进 
行 姓名 相似 度 比较 ， 然 后 利用 专利 文献 中 可 获 
取 的 发 明 人 特征 信息 进行 判断 ， 以 实现 人 名 消 
歧 ， 见 图 1。 
2.2 专利 发 明 人 姓名 结构 特征 及 影响 

不 同 国家 来 源 发 明 人 姓名 的 结构 特征 对 人 
名 歧义 的 影响 有 所 不 同 。 通 过 实际 数据 查看 ， 可 
以 发 现 发明 人 姓名 结构 特征 主要 分 为 两 类 : 其 
一 是 类 西方 姓名 结构 ; 其 二 是 类 中 国 姓名 结构 。 
这 两 种 姓名 结构 特征 见 表 1。 两 种 姓名 的 结构 特 
征 决定 了 类 西方 姓名 中 出 现 不 同姓 名 表述 同 指 
概率 更 高 ， 而 类 中 国 姓名 中 出 现 同样 姓名 表述 
却 不 同 指 的 概率 更 高 。 
2.3 专利 发 明 人 特征 信息 

在 DI 与 TI 数据 库 中 涉及 到 的 专利 发 明 
人 特征 信息 包括 姓名 缩写 、 姓 名 全 称 、 地 址 
(其 中 包括 发 明 人 国家 信息 ) 、 所 属 专利 和 人 藏 
号 、 所 属 机 构 、 合 作 人 员 等 信息 ( 见 表 2 ) 。 这 
些 信息 在 数据 库 中 的 完备 程度 有 所 不 同 ， 整 体 
来 说 : TI 中 的 姓名 信息 完备 程度 要 高 于 DII 
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数据 库 ; @ TI 姓名 全 称 字段 的 取 值 却 有 部 分 
专利 与 姓名 缩写 取 值 相同 ， 属 于 不 完备 状态 ; 
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(3) 地 址 信息 中 的 国家 信息 完备 程度 高 于 城市 等 信 
Bs 专利 入 藏 号 及 合作 人 员 信 息 均 较 为 完备 。 


图 1 专利 发 明 人 人 名 消 歧 流 程 


R1 专利 发 明 人 姓名 结构 特征 


姓名 结构 DII 数据 库 姓 名 处 理 对 人 名 歧义 的 影响 
名 : 保留 全 称 不 同姓 名 表述 同 指 的 概率 更 高 


类 西方 姓名 名 中 间 名 姓 中 间 名 : 保留 全 称 / 首 字母 缩写 / 不 体现 


姓 : 首 字母 缩写 /不 体现 
姓 : 保留 全 称 
名 : 首 字母 缩写 


类 中 国 姓名 姓名 


表 2 专利 发 明 人 特征 信息 


同样 姓名 表述 却 不 同 指 的 概率 更 高 


发 明 人 特征 信息 来 源 数据 库 (来源 字段 ) 完备 程度 取 值 示例 
DIIAU 2 DRIESSEN M 
姓名 缩写 1 ) 
TI( / 8] A. -DWPD 3 DRIESSEN M 
姓名 全 称 TI( HJ A, - 原始 ) 2 Driessen Marcus Matheus 
地 址 TI( RHA - 带 有 地 址 ) 2 Driessen Marcus Matheus,Maasbracht,NL 
时 " DII(GA 3 2010-L63571 
所 属 专利 入 茂 号 
TI(DWPI 入 藏 号 ) 3 2010L63571 
DII(AE 2 DSM IP ASSETS BV 
所 属 机 构 ih " 
TI( 专利 权 人 - 原始 ) 2 DSM IP Assets B.V. 
AER DII(AU) 2 EL-SIBLANI A; SHKOLNIK A 
a 
MES TI( 发 明 人 - 原始 ) 3 SHKOLNIK, Alexandr | EL-SIBLANL Ali 


注 : 完备 程度 表示 在 数据 库 中 对 所 有 专利 文献 该 字段 有 值 数 据 涵盖 范围 ，3 代表 全 部 专利 该 字段 均 有 值 且 数据 结 
构 较 为 规范 ; 2 代表 少 部 分 专利 该 字段 为 空 或 取 值 相对 不 完整 。 


2.4 人 名 消 歧 规则 

人 名 消 歧 首先 要 找 出 那些 可 能 存在 疑问 的 
姓名 表述 方式 ， 这 就 需要 根据 专利 发 明 人 姓名 
相似 程度 来 进行 判断 ， 具 体 的 判断 标准 见 表 3。 
需要 指出 的 是 ， 此 处 的 判断 不 考虑 姓名 表述 中 


出 现 的 圆 点 、 连 词 符 等 符号 信息 。 

基于 以 上 专利 发 明 人 姓名 结构 特征 〈 见 表 
1 ) 及 可 获取 的 专利 发 明 人 特征 信息 ( 见 表 2 ) , 通 
过 实际 数据 验证 ， 可 以 按 优先 级 构建 出 如 下 类 
西方 姓名 及 类 中 国 姓名 的 人 名 消 牙 规则 。 
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表 3 专利 发 明 人 姓名 相似 程度 判定 标准 
示例 
姓名 结构 相似 程度 判定 标准 
姓名 缩写 姓名 全 称 
类 西方 姓名 ”相同 表述 完全 一 致 ALLANICAL Allanic Andre Luc 
ALLANICAL Allanic Andre Luc 
相似 名 表述 一 致 ，@ 若 有 中 间 名 ， 则 首 字母 CHAWLA CP | CHAWLACP 
缩写 一 样 ，@ 若 有 姓 ， 则 首 字 母 缩 写 一 样 CHAWLAPC Chawla Chander P 
CHAWLAP CHAWLA Prakash 
CHAWLA Chander 
不 同 但 相近 ”名 表述 仅 有 一 个 字母 不 同 ，@ 中 间 名 与 GOIHAITH Goihait Hanan 
姓 至 少 有 一 项 ，@ 若 有 中 间 名 ， 则 首 字母 GOTHAIT H GOTHAIT HANAN 
缩写 一 样 ，@ 若 有 姓 ， 则 首 字 母 缩写 一 样 
不 同 非 以 上 3 种 情况 
类 中 国 姓名 相同 表述 完全 一 致 LuoL Luo Lei 
LuoL Luo Lei 
相似 姓 表 述 相 同 ， 名 表述 第 一 个 字母 相同 ， 后 LiD == 
续 表 述 缺 少 Li Dichen 
不 同 名 表述 首 字母 不 同 LuoL Luo Lei 
LuoX Luo Xiao 


24.1 类 西方 姓名 消 上 下 规则 

根据 类 西方 姓名 的 结构 特征 ， 可 以 明确 对 
此 类 姓名 消 上 政 的 重点 在 于 将 同一 人 的 多 种 姓名 
表述 归 一 为 一 种 表述 。 因 此 对 类 西方 姓名 的 消 


攻 以 专利 发 明 人 姓名 缩写 为 人口 开始 ， 一 方面 
可 以 尽 可 能 排除 非 同 一 人 的 姓名 表述 ， 男 一 方 
面 也 可 以 将 尽 可 能 多 的 姓名 表述 纳入 进一步 判 
断 范畴 。 上 具体 规则 描述 如 表 4 所 示 : 


表 4 类 西方 姓名 消 歧 规 则 


序号 姓名 缩写 AWS EKER 国家 所 属 机 构 共同 合作 人 结论 

1 不 同 非 同 一 人 

2 相同 同一 人 

3 相同 不 同 不 同 非 同 一 人 
不 同 " 

4 相同 有 重复 同一 人 概率 大 

5 相同 相同 / 相似 同一 人 

6 - 有 重复 同一 人 

7 相似 相同 无 重复 非 同 一 人 概率 大 
不 同 相似 ] 

8 不 后 无 重复 非 同 一 人 概率 大 

9 不 同 非 同 一 人 

10 相同 非 同 一 人 

不 同 但 相近 
11 不 同 相同 [E] — A. 
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2.4.2. 类 中 国 姓名 消 歧 规则 
根据 类 中 国 姓 名 的 结构 特征 ， 可 以 明确 对 
此 类 姓名 消 歧 的 重点 在 于 将 不 同人 同样 表述 的 
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姓名 区 分 开 来 。 同 样 选择 从 姓名 缩写 为 入口 开 
始 ， 以 尽 可 能 区 分 出 非 同 一 人 的 情况 。 具 体 规 
则 描述 如 表 5 所 示 : 


表 5 类 中 国 姓名 消 歧 规 则 
序号 姓名 缩写 入 藏 号 EZE 所 属 机 构 < 同 合作 人 结论 
12 不 同 非 同一 人 
13 不 同 非 同一 人 
14 相同 同一 人 概率 大 
15 相同 相同 有 重复 。 同一 人 
16 不 同 相同 无 重复 非 同 一 人 概率 大 
17 不 同 非 同一 人 概率 大 
18 相同 同一 人 
19 相似 有 重复 同一 人 
20 不 全 /不 同 非 同 一 人 概率 大 


值得 注意 的 是 ， 在 对 于 以 上 人 名 进行 消长 
过 程 中 ， 结 论 仅 为 概率 性 判定 ， 而 非 确定 性 结 
果 的 规则 ， 需 要 给 出 相关 具体 条 目 ， 进 行 扩展 
查询 ， 辅 以 人 工 判断 来 给 出 最 终结 论 。 在 完成 
人 和 名 消 时 的 基础 上 ， 可 以 根据 数据 情况 ， 按 共 
同 拥有 专利 数量 或 比例 情况 来 确定 不 同 数据 集 
的 主要 研发 团队 判定 标准 ， 从 而 通过 专利 发 明 
人 共 现 聚 类 来 实现 研发 团队 识别 。 


O 基于 人 名 消 歧 的 数字 光 处 理 研发 
团队 识别 实证 研究 


本 文 以 3D 打印 的 数字 光 处 理 (Digital 
Light Process, DLP ) 技术 相关 专利 为 例 来 进行 
人 名 消 歧 后 研发 团队 识别 的 具体 实证 。 

3.1 人 名 消 歧 数量 统计 结果 对 比 

经 过 检索 及 专家 判读 后 ， 从 DII 数据 库 中 
共 获 取 DLP 技术 相关 专利 274 项 、810 件 。 同 
一 批 专利 经 过 的 温 特 入 藏 号 及 发 明 人 姓名 表述 
去 重 后 ，DII 原始 数据 中 共 涉 及 640 个 专利 发 明 
人 姓名 表述 ，TI 原始 数据 中 共 涉 及 652 个 专利 


发 明 人 姓名 表述 ， 按 照 2.4 小 节 所 述 规则 进行 人 
名 消 歧 , 按照 TI 数据 中 的 姓名 简称 进行 统计 , 发 
现 DLP 技术 的 120 名 发 明 人 存在 同一 人 多 种 姓 
名 表述 , 共有 90 种 姓名 表述 为 多 人 重 名 情况 , 最 
终 确定 共有 602 名 发 明 人 参与 研发 。 

人 名 消 上 层 前 后 主要 发 明 人 (参与 研发 
专利 数量 大 于 3 项 ) 及 其 专利 数量 分 布 见 表 
6。 可 以 看 出 ， 通 过 人 名 消 歧 ， 主 要 发 明 人 
HULL CHARLES W 的 专利 数量 从 5 项 变 为 6 
项 ，KRITCHMAN Eliahu M. 的 专利 数量 从 4 项 
变 为 5 项 (以 上 见 表 6 中 阴影 部 分 ) ， 使 得 主 
要 发 明 人 数量 排序 及 数量 统计 更 为 准确 。 

32 人 名 消 歧 后 研发 团队 识别 研究 

在 人 名 消 歧 的 基础 上 ， 首 先 利 用 Bibexcel 
生成 发 明 人 共 现 矩阵 ， 生 成 可 供 可 视 化 的 节点 
数据 ， 然 后 利用 Pajek 工具 得 到 图 2 所 示 的 发 
HAR. DLP 技术 领域 中 的 602 名 发 明 
人 中 共有 63 名 发 明 人 参与 聚 类 。 根 据 数 据 情 
况 ， 本 文 定义 研发 团队 中 至 少 需要 包括 3 名 发 
明 人 。 
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表 6 DLP 技术 相关 专利 主要 发 明 人 统计 比 对 ( 专利 数量 >3 项 ) 


| 数量 | 数量 
Ae iB BUG 所 属 机 构 cos 人 名 消 歧 前 
3D SYSTEMS INC 6 ELSIBLANIA 6 
El-Siblani Ali Global Filtration Systems, Inc. 6 AME 5 
ENVISIONTEC GMBH 
Napadensky Eduardo STRATASYS INC 5 NAPADENSKY E 5 
PARTANEN JOUNI P 3D SYSTEMS INC 5 PARTANEN J P 4 
STRATASYS INC 5 GRELIN J 4 
Grelin Jerome HUNTSMAN 4 LID 4 
LI Di-chen UNIV XIAN SCI & TECHNOLOGY 4 Essen 4 
XIAN JIAOTONG UNIV 
Larsen Niels Holm HUNTSMAN 4 LARSEN NH 4 
Hangaard Ole HUNTSMAN 4 SHKOLNIK A 4 
FUJISAWA KAZUTOSHI SEIKO EPSON CORP 4 FUJISAWA K 4 
Shkolnik Alexandr Global Filtration Systems, Inc. 4 HANGAARD O 4 


ENVISIONTEC GMBH 


从 图 2 中 可 以 清楚 看 到 DLP 技术 领域 
共有 来 自 6 个 机 构 的 7 个 研发 团队 。 表 7 展 
现 了 这 些 研发 团队 的 情况 。 可 以 发 现 , 来自 
HUNTSMAN 公司 的 两 个 研发 团队 在 DLP 技术 
领域 并 无 联系 人 员 ， 因 此 被 明显 区 分 为 两 个 团 


SkUEK SOONI 


OC Sbeny Cheias A 


PC Gregayy Il Richard Ora. 


3D SYSTEMS 


队 ; 来 自 3D SYSTEMS INC 的 研发 团队 共 由 11 
人 组 成 ， 这 11 人 又 可 以 大 致 区 分 为 两 个 团队 
(在 表 7 中 用 A、B 表示 ) ， 两 个 团队 以 HULL 
CHARLES W 和 PARTANEN JOUNIP 为 纽带 ,在 
2 中 呈现 为 一 个 大 的 团 簇 。 


DTEMMER Heike 


© HULL CHARLES W 
Dunne Patrick 


MANNERS CHRIS R 


C Mcnamara Dennis 


PEUIISAWA KAZUTOSHI 


PkuMAGAI TOSHIO 


PC Grelin Jerome 


HUNTSMAN 
P Larsen Niels Holm 


Hangaard Dl 


CPETERSEN MICHAEL A. 


F SPARTANEN JOUNIP 


SecOTT SUZANNE M 


C wehring Ralf 


PPQUGEOISE Emilie 


SGREBE MAIK 


m EVONIK DEGUSSA GMBH 
WARNKE KRISTIANE 


OKEREKES THOMAS ALA 


" BAUMANN FR 
DIEKMANN WOLFGANG 


yOSHI KEN 
O MIYAZAKI MAKOTO 


O Gothait Hara 


SNapadensky Eduardo 


rak Carsten 


BIRATASYSINC ÜCKRITCHMAN Elishu M 


P uenchik Guy 
P Bavich Diana 


o KUNG 
HUANG SHENGJIE 


P HAGIWARA TSUNEO 
SARMAH SATYENDRA KUMAR 


" Conana YUYA. 
ARAS KEVIN ANDREW o 
KUROSAWA TAKAHIKO 
o. OTAKASE KATSUYUKI 
LI Dichen 


9, M 
Brodkin Dmitri ou HUNTSMAN PATEL RANJANA C 


Cherkaoui Zoubai M. 


HIROAKI P Panzera Carino P MOROHOSHI KIMITAKA 
o D ^ 
TSUBOI KUNIO Honda kattia n STERAMOTO TOSHIO 
- : Chiang Po Liang E 
Kihara Nobuhiro Eshed David 
M uL 
Tsai Hsin Wen DBar Nathan Meir 
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图 2 DLP 技术 相关 专利 发 明 人 共 现 聚 类 
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R7 DLP 技术 研发 团队 情况 ( 单位 : 项 ) 
研发 团队 [专利 数量 ] 团队 专利 数量 所 属 机 构 
HULL CHARLES W[6] 19 3D SYSTEMS INC 
PARTANEN JOUNI P[5] 


A)Gregory II Richard Ora[3] 
AJ)KEREKES THOMAS ALAN[3] 
A)Wang Hongqing V[3] 

AJKUEK SOON-CHUN[2] 
B)MANNERS CHRIS R[2] 
B)Menamara Dennis F[2] 
B)SCOTT SUZANNE M[2] 
B)Sperry Charles R[2] 


B)Dunne Patrick[2] 
Napadensky Eduardo[5] 14 STRATASYS INC 


KRITCHMAN Eliahu M.[5] 
Gothait Hanan[3] 

Menchik Guy[2] 

Miller Gershon[2] 


Ravich Diana[2] 
El-Siblani Ali[6] 6 ENVISIONTEC GMBH 


Shkolnik Alexandr[4] 


John Hendrik[2] 
Grelin Jerome[4] 4 HUNTSMAN 


Larsen Niels Holm[4] 
Hangaard Ole[4] 
PETERSEN MICHAEL A[2] 


POUGEOISE Emilie[2] 
BAUMANN FRANZ-ERICH[2] 2 EVONIK DEGUSSA GMBH 


DIEKMANN WOLFGANG[2] 
GREBE MAIK[2] 
MONSHEIMER SYLVIA[2] 
STEMMER Heike[2] 


WARNKE KRISTIANE[2] 
HUANG SHENG-JIE[2] 2 UNIV NAT CHENG KUNG 


LEE SEN-YUNG[2] 


WANG JIUE-KUAN[2] 
Cherkaoui Zoubai M[2] 2 HUNTSMAN 


Frantz Richard[2] 
PATEL RANJANA C[2] 


202310.03159v1 


chinaXiv 


PA 


www.kmf.ac.cn 


知识 管理 论坛 


2016 年 第 3 期 (总 第 3 期 ) 


3.3 实证 研究 小 结 

由 于 本 文人 名 消 疏 规则 是 结合 特定 数据 库 
的 数据 结构 所 提出 来 的 ， 不 具有 普 适 性 ， 因 此 
并 未 进行 人 名 消 歧 规则 性 能 测评 。 

但 通过 3.1 部 分 人 名 消 靶 前 后 主要 发 明 人 拥 
有 专利 数量 对 比 可 以 发 现 ， 主 要 发 明 人 的 排序 有 
所 变化 。 即 通过 本 文 提 出 的 人 名 消 靶 ， 使 得 主要 
发 明 人 数量 排序 及 数量 统计 更 为 准确 ， 有 利于 发 
明 人 专利 数量 的 准确 分 析 ， 能 够 减少 由 于 发 明 人 
人 名 是 否 同 指 的 不 确定 性 而 带 来 的 研发 团队 识别 
误差 , 亦 有 助 于 更 准确 地 进行 专利 研发 团队 识别 。 


Oie 


人 名 消 歧 结果 的 准确 性 将 影响 到 专利 分 析 
结果 的 准确 性 ， 从 而 影响 依 此 为 参考 而 进行 的 
竞争 对 手 识 别 及 相关 人 才 政 策 决 策 ， 因 此 人 各 
消 收 是 专利 分 析 不 断 深入 过 程 中 需要 解决 的 重 
要 问题 之 一 。 

本 文 认为 ,专利 研发 团队 识别 过 程 中 的 人 
名 消 疏 应 以 确保 准确 性 为 前 提 。 因 此 ， 本 文 提 
出 的 人 名 消 靶 规 则 借鉴 了 特征 向 量 相似 度 判 定 
的 思路 ,但 在 实际 操作 过 程 中 ， 具 有 与 其 他 方 
法 不 同 的 两 方面 特征 : 一 是 基于 特定 专利 数据 
库 数 据 结构 特征 来 提炼 规则 ,更 具有 针对 性 ; 二 
是 对 于 无 法 在 逻辑 上 直接 给 出 确定 性 结论 的 规 
则 所 涉及 条 目 辅 以 人 工 判 断 来 尽量 确保 准确 
性 ， 从 而 避免 其 他 方法 直接 判定 而 带 来 部 分 不 
确定 性 的 “黑箱 ”问题 。 

本 文 的 人 名 消 靶 规则 通过 实证 研究 证 明 是 
有 利于 发 明 人 专利 数量 的 准确 分 析 的 ， 但 需要 
指出 的 是 ， 本 文 所 提出 的 规则 是 基于 特定 专利 
文献 数据 的 ， 得 出 的 规则 本 身 在 实际 应 用 范围 
上 具有 局 限 性 ， 但 针对 特定 数据 而 言 更 具 准 确 
性 。 在 今后 的 研究 中 ， 需 要 进一步 探索 完善 人 
名 消 牙 方法 ,扩展 人 名 消 牙 规则 ， 货 站 其 适用 
的 数据 范围 ， 从 而 更 好 地 进行 研发 团队 识别 。 
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Abstract: [Purpose/significance] Talent is the main factor in technology research. R&D teamsare 


the focus of technology development in various fieldsandimportant manifestation of the competence of an 


institution. [Method/process| Based on Derwent Innovation Index (DII) patent documents, the rules for the 


disambiguation of patent inventors’ names weredefined, and the key R&D teams were identified by inventors 


clustering. Then, an empirical study was carried out on patents related to Digital Light Process (DLP) of 3D 


printing. [Result/conclusion] It is shown that the disambiguation of patent inventors’ names is helpful to 


accurately analyze the number of inventors' patents. 
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